技術問答
技術文章
iT 徵才
Tag
聊天室
2024 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2021 iThome 鐵人賽
DAY
13
0
DevOps
中台化轉型
系列 第
13
篇
基礎建設: 系統監控與告警
13th鐵人賽
HO-HSUN
2021-09-13 00:25:43
1423 瀏覽
分享至
系統架構
系統監控是維護資源可靠性、可用性與效能的重要環節。
指標計算
即時計算:即時的本地服務指標更新
日誌統計:整體資源的指標計算,例如:叢集服務的QPS指標。
離線計算:使用Hive、Spark
串流計算:使用Flink、Storm
監控系統
主動獲取:利用Prometheus系統及代理程式主動收集所需監控資料。
被動獲取:收集系統日誌。
告警系統
依據觸發模式及設置的規則進行即時的告警
計算種類
指標紀錄
指標管理
瞬時(Gauges):系統瞬時尖峰負載
計數(Counter)
速率(Meter)
直方(Histograms):資料分布
性能(Timers):QPS、反應時間
指標介面
JSON
Prometheus
Others
監控系統
Prometheus:指標資料收集、儲存、查詢、告警。
Service Discovery:提供服務定址功能。
Pushgateway:資料主動推送(Pull)介面。
AlertManager:告警規則及通知規則操作界面。
Grafana:監控儀錶板及操作界面。
留言
追蹤
檢舉
上一篇
基礎建設: 事件與訊息系統
下一篇
基礎建設:分散式服務追蹤
系列文
中台化轉型
共
30
篇
目錄
RSS系列文
訂閱系列文
6
人訂閱
26
大數據平台:資料倉儲
27
大數據平台:分散式計算
28
大數據平台:分散式檔案
29
大數據平台:訊息中介
30
大數據平台:叢集管理
完整目錄
直播研討會
{{ item.subject }}
{{ item.channelVendor }}
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
1064
組
團體組數
40
組
累計文章數
22208
篇
完賽人數
600
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
windows server
linux
css
react
vue.js
熱門問題
安卓電視盒
虛擬機點啟動 卻出現錯誤
PDF影像資料不足
安裝DRIVER一問
win10系統,一個資料夾無法刪除(因裡面有太多層子資料夾),求刪除的解法
防火牆阻擋無法打開某些網頁的問題
請問大家都是如何進行部屬前的程式測試
商品計價公式
關於pychram 安裝新的anaconda後設定完全亂掉了.求前輩們幫忙查看哪裡設定出錯了.
開啟wifi後在輸入帳密視窗卡住
熱門回答
商品計價公式
PDF影像資料不足
如何阻止系統再次安裝 KB5048652 更新(或某一個更新)
關於pychram 安裝新的anaconda後設定完全亂掉了.求前輩們幫忙查看哪裡設定出錯了.
POWER BI 抓MSSQL 資料,能法抓區間資料
熱門文章
使用LINE發報機房溫度/濕度 過高通知
每日一篇學習筆記 直到我做完專題 :( [Day41]
每日一篇學習筆記 直到我做完專題 :( [Day42]
探索容器資源限制:透過實驗理解 Docker 的 CPU 和記憶體調度 (2)
體驗SQL資料庫Day2:常用資料型態解析和資料操作
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}